Text copied to clipboard!

Titlu

Text copied to clipboard!

Inginer Fiabilitate Site (SRE)

Descriere

Text copied to clipboard!
Căutăm un Inginer Fiabilitate Site (SRE) pasionat și experimentat care să se alăture echipei noastre tehnice. În acest rol, vei fi responsabil pentru menținerea fiabilității, disponibilității și performanței sistemelor noastre informatice critice. Vei colabora strâns cu echipele de dezvoltare și operațiuni pentru a construi soluții scalabile, automatizate și rezistente la erori. Responsabilitățile tale vor include monitorizarea continuă a infrastructurii, identificarea și remedierea incidentelor, precum și îmbunătățirea continuă a proceselor de livrare și operare. Vei contribui la dezvoltarea și implementarea de instrumente și practici care să reducă intervențiile manuale și să crească eficiența operațională. Un candidat ideal are o înțelegere solidă a arhitecturilor distribuite, experiență în automatizare și scripting, precum și cunoștințe avansate despre sisteme de operare, rețelistică și baze de date. De asemenea, este important să ai o mentalitate orientată spre rezolvarea problemelor și o atitudine proactivă în prevenirea incidentelor. În cadrul echipei noastre, vei avea oportunitatea de a lucra cu tehnologii moderne precum Kubernetes, Docker, Prometheus, Grafana, Terraform și multe altele. Ne dorim o persoană care să contribuie activ la cultura DevOps și să promoveze bune practici de inginerie software. Dacă ești pasionat de fiabilitate, scalabilitate și performanță, și îți dorești să faci parte dintr-o echipă dinamică și inovatoare, te încurajăm să aplici!

Responsabilități

Text copied to clipboard!
  • Monitorizarea și menținerea fiabilității sistemelor de producție
  • Automatizarea proceselor operaționale și de livrare
  • Gestionarea incidentelor și analiza cauzelor principale
  • Colaborarea cu echipele de dezvoltare pentru îmbunătățirea aplicațiilor
  • Implementarea și întreținerea instrumentelor de monitorizare și alertare
  • Optimizarea performanței infrastructurii și aplicațiilor
  • Asigurarea scalabilității și disponibilității serviciilor
  • Documentarea proceselor și a arhitecturii sistemelor
  • Participarea la rotația de on-call pentru suport tehnic
  • Promovarea culturii DevOps și a practicilor SRE

Cerințe

Text copied to clipboard!
  • Experiență anterioară ca SRE, DevOps sau inginer de sistem
  • Cunoștințe solide de Linux/Unix și scripting (Bash, Python etc.)
  • Experiență cu containere și orchestrare (Docker, Kubernetes)
  • Familiaritate cu instrumente de monitorizare (Prometheus, Grafana, ELK)
  • Cunoștințe despre rețelistică, DNS, HTTP, TCP/IP
  • Experiență cu infrastructură ca cod (Terraform, Ansible)
  • Abilități de rezolvare a problemelor și analiză a incidentelor
  • Capacitatea de a lucra în echipă și de a colabora eficient
  • Cunoștințe despre baze de date relaționale și NoSQL
  • Studii superioare în informatică sau domenii conexe

Întrebări posibile la interviu

Text copied to clipboard!
  • Ce experiență ai în automatizarea proceselor operaționale?
  • Ai lucrat anterior cu Kubernetes sau alte sisteme de orchestrare?
  • Cum ai gestionat un incident major în trecut?
  • Ce instrumente de monitorizare ai folosit și cum le-ai configurat?
  • Cum asiguri scalabilitatea unui sistem distribuit?
  • Ai experiență cu infrastructură ca cod? Ce tehnologii ai folosit?
  • Cum prioritizezi sarcinile în timpul unui incident critic?
  • Ce înseamnă pentru tine cultura DevOps?
  • Cum colaborezi cu echipele de dezvoltare pentru a îmbunătăți fiabilitatea?
  • Ce provocări ai întâmpinat în roluri anterioare de SRE?